【跟着文献学临床科研】如何利用分子实验验证GWAS发现的SNP?
The following article is from 生信草堂 Author 咖喱
“临床科研群”分享的精彩讨论和点评:
(图片来源:https://mhens.mumc.maastrichtuniversity.nl/research-3)
Mark:
这张图很棒。认识的一位台湾来的博后Bida就是:
Step 1,流行病学发现,美国white和black的癌症发病率有显著不同,除了表观遗传如环境和饮食等的问题,GWS研究发现了几个有区别且可能有功能的基因;
Step 2, Bida课题组做了更精细的基因筛查,筛选出更多white 和black的区别基因;
Step 3, 通过生物信息学验证,他们找到了几个有功能的突变;
Step 4, 分子生物学验证了其功能;
Step 5, 然后做了单抗干预,发现有效;申请了专利;
Step 6, 得到GSK(好像)资助做了进一步的动物模型上的功能验证,有效。
Step 7, 继续申请专利,做药物研发。
这个系列研究,
足够一个临床研究科学家花费几年、
十几年甚至一辈子的精力来做;
从莘莘学子到大医生。
扩展出去,还有miRNA,也是如此。这几年SNP申请基金已经很难了,其实SNP是最可以直接解决问题的靶点,这是需要烧钱筛。
miRNA也走了一长段时间的火热和低迷,但是随着今年miRNA研发的老大Alnylam公司药物获得FDA批准,后续的药物研发会有个爆发。
现在,关键的问题来了:
如何筛选到这个靠谱的SNP?
感谢“生信草堂”公众号,授权我们转载他们分享的一篇推文。
一起学习,卖出从小医生到大教授的关键一步。
解释遗传关联分析结果的生物功能一直是一个很大的挑战,而这里要分享的文章则是一个成功的案例。
通过GWAS 发现的SNP rs965513作为risk allele 对甲状腺癌易感性的机制。这篇文章的研究思路可以帮助我们思考遗传变异位点的潜在生物学机制。
位于enhancer或者是非编码RNA中的变异可能很大程度上导致复杂疾病的遗传易感性。
乳头状甲状腺癌(papillary thyroid carcinoma, PTC)是最常见的甲状腺癌症。关联分析指出该疾病很大程度上受到遗传因素的影响。GWAS研究已经发现在9q22区域的单核苷酸多态性(single nucleotide polymorphism, SNP)rs965513(非编码)与PTC有关(odds ratio~1.8),并且在不同人群中的到了独立重复验证。SNP(rs965513)位于 forkhead box E1 (FOXE1)上游的~60 kb。FOXE1是一种已知的甲状腺转录因子,对甲状腺的功能,发育和分化至关重要,并且多次被报道与PTC的癌症发生有关。另一个功能性SNP(rs1867277)位于 FOXE1启动子区域,也被报道与 FOXE1转录调控有关。
最近,这个研究团队发现了一个甲状腺特异性的基因间长非编码RNA基因(PTC susceptibility candidate 2 (PTCSC2)。在人类基因组中,该基因位于FOXE1的反义链上: PTCSC2的transcript isoform c中的exon 1和intron 1 与 FOXE1启动子区域重叠,这说明PTCSC2和FOXE1可能共享同一个启动子或者转录调节机制。在甲状腺组织中,PTCSC2有剪切和未剪切两种转录本:剪切转录本有11个exons和一些不同的剪切亚型,而SNP rs965513正好位于未剪切转录本上(或者剪切的intron上)。另外,在PTC病人的正常甲状腺肿瘤,rs965513的有害基因型[AA]与 FOXE1, PTCSC2, 和TSHR的表达降低显著相关。尽管,这些发现指出了FOXE1
和PTCSC2与PTC的易感性和肿瘤发生的联系,但是SNP rs965513所产生效应的分子机制还是没有得到解释。
细胞中基因表达是受到DNA调节元件和序列特异性转录因子,以及染色质修饰的影响。因此,该团队推测在rs965513周围(9q22)存在FOXE1和 PTCSC2转录的调节元件。于是,他们对9q22位点进行仔细分析和寻找导致PTC的功能性变异。最终,他们根据研究结果暂时得出9q22诱发PTC是通过多种机制,而这些机制涉及到增强子,TF(transcript factor)结合位点,和两个及以上基因的转录变化。
接下来具体介绍该团队的研究过程:
1
重测序,SNP基因分型和Imputation,和Haplotype分析
为了更好的找出9q22位点上的功能性SNPs和PTC相关的变异,该团队对22个PTC病人的染色体9号:100455000–100622000(167 kb)区域进行深度测序并进行LD分析。分析结果显示,在PTC 病人和千人基因组计划EUR个体中,GWAS SNP周围都存在一个33 kb的LD block(图一)。
接着,为了在这33 kb区域中找出与PTC 独立关联的SNPs,该团队在1146 cases和1328 controls中,进行imputation 和haplotype分析。他们发现33 kb中,只有3个haplotypes (Hap1: OR=1.79,Hap2: OR=1.24,Hap3: OR=1.54)包含rs965513的有害allele[A]. 另外,对Hap1的diplotype 分析发现:杂合Hap1携带者的显示OR=1.695,而纯合显示OR=3.423。
总之,这些统计分析结果使他们把研究重点放到~33kb区域。
2
在甲状腺癌细胞系KTC-1和未感染甲状腺组织中,9q22富集了增强子组蛋白标记
考虑到GWAS SNP 在 FOXE1和PTCSC2中的位置,他们猜测33kb中的功能性SNPs是调节了重要的顺式转录调节元件,然后,利用公共数据库进行预测(transcription factor (TRANSFAC) database,Encyclopedia of DNA Elements (ENCODE) ChIP sequencing data, 和HaploReg annotated information), 他们发现有些区域包含了多个TF的结合位点(图二)。因此,他们选择了包含候选SNPs的3个区域,并根据它们的远程调控作用设计为enhancer 1,enhancer 2,和enhancer 3。
3
3个enhancers元件中增强子活性受到SNP allele的影响。
为了研究这3个enhancers的功能是不是受到SNP allele的影响,该团队进行了荧光素酶检测实验。他们对这3个enhancers的risk allele片段和WT allele 片段分别进行扩增,并连接到荧光素酶报告载体上,然后,在KTC-1细胞系中进行检测。根据观察结果显示,enhancer 2 中rs12352658 的 [G] allele和rs7847449的 [C] allele,和enhancer 3 中rs10759944 的[A] allele都显示与WT相比显著增强荧光素酶的活性(图四)。由于enhancer 1没有观察到显著结果,于是,他们在做enhancer 1的荧光素酶实验时,同时转染了表达CEBPa或者CEBPb的质粒。结果,他们观察到,在出现CEBPa或者CEBPb时, enhancer 1 中rs7864322的risk allele [C]显著降低荧光素酶的活性。
这部分实验结果指出, 在9q22位点中至少存在3个增强子元件并且它们的功能受到allele影响。总而言之这部分数据说明GWAS SNP附近有多种allele特异性的远程增强子元件(long-range enhancer element)。
4
针对TFs进行ChIp实验
为了进一步证明3个enhancer 元件中的SNPs的功能,该团队利用ChIp实验技术,检测之前预测的TFs能否结合到enhancers上,和这种作用是否受到allele特异性的影响。于是,他们首先在KTC-1细胞系中检测
首先,他们在KTC-1细胞系中检测一系列预测发现的TFs,包括CEBPa, CEBPb,STAT1, YY1, cJUN, ER, 和TFAP2A。 他们发现CEBPa, CEBPb, 和 TFAP2A有显著的结合作用。在正常的甲状腺组织中,CEBPb显著结合到enhancer 1上,但是没有结合到enhancer 3上(图五)。TFAP2A则显著结合到enhancer 2a和3上(图五)。接着,他们研究这些TFs与enhancers的相互作用是不是具有allele的特异性。在这里,他们用SNaPshot实验对3个正常的甲状腺样本基因基因分型和用ChIp实验检测TFs与enhancers的相互作用。在这3个样本中,SNPs rs7864322, rs12352658, 和 rs10759944的基因型都是杂合的。在enhancer 1中,CEBPb结合到WT allele中的能力要比在risk allele中更强。在enhancer 2和3中,TFAP2A也同样更偏好于结合到WT allele中(图五)。当然,这些结果也在KTC-1细胞系中得到重复验证。
总之,ChIp和荧光素酶实验都证明9q22位点中存在多种基因间远程增强子和一些SNPs可以影响这些enhancers的内在活性。
5
Enhancers与FOXE1 和 PTCSC2的启动子之间的物理作用
考虑到以前研究发现GWAS SNP 影响FOXE1 和 PTCSC2的表达,该团队猜测上面观察到的enhancers可能直接通过与FOXE1 和 PTCSC2启动子的相互作用,从而调节这两个基因的表达。
于是,他们利用染色体构象俘获技术(chromosome conformation capture,3C),在KTC-1细胞系中研究enhancers和启动子之间的物理作用。他们评估相互作用的片段是~33 kb LD 区域以及基因FOXE1 和PTCSC2的上游区域(图六)。Enhancers 1-3分别位于3C片段4-6。当3C实验中使用片段6上的常规引物和探针时,他们观察到片段6和19有很强的相互作用,而片段19非常靠近FOXE1上游(图六),同时又是位于PTCSC2转录亚型c的intron 1内。片段6和19之间的线性距离约为51 kb,这说明这段区域可能形成long-range loop。当使用位于片段19 中的常规引物和探针时,他们观察到片段19和6的作用最强(图六)。这些结果说明9q22中的enhancers 可能与FOXE1 和 PTCSC2的启动子区域形成环状的相互作用,从而调节这两个基因的表达。
总之,该团队的研究为GWAS SNP rs965513作为PTC的有害因素,提供了新的功能注释。
另外,他们还发现了多个功能性SNPs位于多种远程增强子元件上,并且证明这些SNPs有助于解释GWAS SNP所显示的疾病易感性。
附:
【8月25日】从实验室研究到临床应用之路 - 临床科研学术交流
编辑:Daniel。图片来自于网络,版权归原作者所有。
欢迎关注我们的公众号,也欢迎加入“临床科研群”,请备注您的研究领域和所在地域,如帕金森病 - 广州。
微信号:Healsan
Email: healsanconsulting@gmail.com
恒祥临床科研,来自美国
专注于传播临床科研知识
广而告之:
(直接点击获得更详细信息)
专职生物医学论文编辑,
美国顶尖大学任职,发过Nature杂志;
目光如炬,认真细致。
最关键的是:
曾在清华大学工作,懂中文,
可以理解您的Chinglish。